#!/usr/bin/env bash

AREA_TXT="area.txt"
AREA_YAML="area.yaml"

main()
{
    rm -f $AREA_YAML
    touch $AREA_YAML

    local awk_file=tmp.awk
    cat >$awk_file <<'EOF'
BEGIN {
}
{
    gsub(/\xe3\x80\x80/, " ");   # 去除全角空格: \u3000
    gsub(/\xc2\xa0/, " ");       # 去除不间断空格: \u00a0

    if(NF == 2)
    {
        if($1 !~ /^71/ && $1 !~ /^81/ && $1 !~ /^82/)
        {   # 去除台湾、香港、澳门
            if($1 ~ /^[0-9]{2}0000/)
            {   # 省
                provs[prov_count++]=$0;
            }
            else if($1 ~ /^[0-9]{4}00/)
            {   # 市
                cities[city_count++]=$0;
            }
        }
    }
}
END {
    printf("province:\n");
    for(i=0; i<length(provs); i++)
    {
        split(provs[i], arr);
        printf("    - id:\t%s\n      name:\t%s\n", arr[1], arr[2]);
    }

    printf("\n");

    printf("city:\n");
    for(i=0; i<length(cities); i++)
    {
        split(cities[i], arr);
        printf("    - id:\t%s\n      name:\t%s\n", arr[1], arr[2]);
    }
}
EOF
    awk -f $awk_file $AREA_TXT >>$AREA_YAML
}

main
